본문으로 건너뛰기

zz. 데이터 분석 관련 패키지 목록

데이터 시각화 패키지

  • Matplotlib: 기본적인 그래프 작성을 위한 라이브러리
  • Seaborn: 통계 데이터 시각화에 특화된 라이브러리
  • Plotly: 인터랙티브 시각화를 위한 라이브러리
  • Bokeh: 웹 브라우저용 인터랙티브 시각화 라이브러리
  • Altair: 선언적 시각화 라이브러리

머신러닝 및 통계 패키지

  • scikit-learn: 머신러닝 알고리즘과 도구 제공
  • statsmodels: 통계 모델링과 검정을 위한 라이브러리
  • PyMC3: 베이지안 통계 모델링 및 확률적 머신러닝 라이브러리
  • XGBoost: 그래디언트 부스팅 구현 라이브러리
  • LightGBM: 경량 그래디언트 부스팅 프레임워크

딥러닝 패키지

  • TensorFlow: 구글에서 개발한 딥러닝 프레임워크
  • PyTorch: 페이스북에서 개발한 딥러닝 프레임워크
  • Keras: 사용하기 쉬운 고수준 신경망 API

자연어 처리 패키지

  • NLTK: 자연어 처리를 위한 라이브러리
  • spaCy: 산업용 자연어 처리 라이브러리
  • Gensim: 토픽 모델링과 문서 유사도 분석 라이브러리

이미지 처리 패키지

  • OpenCV: 컴퓨터 비전 라이브러리
  • Pillow: 이미지 처리 라이브러리
  • scikit-image: 이미지 처리 알고리즘 라이브러리

대규모 데이터 처리 패키지

  • Dask: 병렬 컴퓨팅 라이브러리
  • PySpark: Apache Spark의 Python API
  • Vaex: 메모리에 들어가지 않는 대용량 데이터셋 처리 라이브러리

지리 데이터 분석 패키지

  • GeoPandas: 지리 데이터 분석을 위한 pandas 확장
  • Folium: 인터랙티브 지도 시각화 라이브러리
  • Cartopy: 지도 투영 및 지리 데이터 시각화 라이브러리

시계열 분석 패키지

  • Prophet: 페이스북에서 개발한 시계열 예측 라이브러리
  • statsmodels.tsa: 시계열 분석을 위한 statsmodels 모듈
  • pmdarima: 자동 ARIMA 모델링 라이브러리

데이터 수집 패키지

  • Requests: HTTP 요청을 위한 라이브러리
  • Beautiful Soup: HTML 및 XML 파싱 라이브러리
  • Scrapy: 웹 크롤링 프레임워크
  • Selenium: 웹 브라우저 자동화 라이브러리